视频生成技术

TIP

TIP-I2V是一个包含大量真实文本和图像提示的数据集，专为图像到视频生成领域设计。它涵盖了超过170万个独特的提示，并结合多种顶级图像到视频生成模型生成的视频内容。该数据集支持用户偏好分析、模型性能评估以及解决错误信息传播等问题，有助于推动图像到视频生成技术的安全发展。

AI项目与工具 2025年06月12日 23 点赞 0 评论 569 浏览

Ingredients

Ingredients是一款基于多身份图像与视频扩散Transformer的视频生成框架，支持多身份特征的高效整合与动态分配。其核心模块包括面部提取器、多尺度投影器和ID路由器，能够保持身份一致性并生成高质量视频内容。无需额外训练即可实现个性化视频制作，适用于娱乐、广告、教育等多个领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 762 浏览

ConceptMaster

ConceptMaster是一款基于扩散Transformer模型的多概念视频生成框架，可在无需测试调优的情况下生成高质量、概念一致的视频。通过解耦多概念嵌入并独立注入模型，有效解决身份解耦问题，尤其擅长处理高度相似的视觉概念。该工具支持多概念视频定制、高质量数据收集和全面的基准测试，适用于视频创作、动画制作、游戏开发及产品展示等领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 645 浏览

FlashVideo

FlashVideo是由字节跳动团队研发的高分辨率视频生成框架，采用两阶段方法优化计算效率。第一阶段在低分辨率下生成高质量内容，第二阶段通过流匹配技术提升至1080p，仅需4次函数评估。其特点包括高效计算、细节增强、快速预览及多场景应用，适用于广告、影视、教育等领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 569 浏览

LanDiff

LanDiff是一种结合自回归语言模型和扩散模型的文本到视频生成框架，采用粗到细的生成策略，有效提升语义理解与视觉质量。其核心功能包括高效语义压缩、高质量视频生成、语义一致性保障及灵活控制能力。支持长视频生成，降低计算成本，适用于视频制作、VR/AR、教育及社交媒体等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 656 浏览

Seaweed

Seaweed-7B 是一款由字节跳动开发的视频生成模型，拥有约 70 亿参数，支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能，适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术，结合多阶段训练与优化策略，提升生成效率与质量，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 80 点赞 0 评论 667 浏览

FramePack

FramePack 是斯坦福大学推出的开源 AI 视频生成模型，通过帧上下文打包和抗漂移采样技术，实现高效、稳定的视频生成。其仅需 6GB 显存即可运行，支持实时高清视频生成，具备灵活的调度策略，适用于多种应用场景，如短视频制作、游戏开发、教育与广告等，显著降低了视频生成的硬件门槛。

AI项目与工具 2025年06月11日 23 点赞 0 评论 897 浏览

MAGI

MAGI-1是一款由Sand AI开发的开源视频生成大模型，采用自回归架构，支持高效、高质量的视频生成，具备高分辨率输出、无限扩展能力和可控生成特性。适用于内容创作、影视制作、游戏开发等多个领域，技术上融合了自回归去噪、Transformer VAE、扩散模型等创新方法，提升生成效率与稳定性。

AI项目与工具 2025年06月11日 37 点赞 0 评论 542 浏览

HunyuanCustom

HunyuanCustom是腾讯混元团队开发的多模态视频生成框架，支持图像、音频、视频和文本等多种输入条件，生成高质量定制化视频。采用文本-图像融合与图像ID增强技术，提升身份一致性和视频真实性。适用于虚拟人广告、虚拟试穿、视频编辑等场景，具备音频驱动和视频驱动两种生成方式，展现强大可控性与灵活性。

AI项目与工具 2025年06月11日 73 点赞 0 评论 687 浏览

LTXV

LTXV-13B 是 Lightricks 推出的开源 AI 视频生成模型，拥有 130 亿参数，可在消费级显卡上高效运行，生成速度比同类产品快 30 倍。支持文本、图像转视频及多关键帧调节，具备多尺度渲染和高压缩率技术，适用于影视、广告、游戏、教育等多个领域，提升内容创作效率与质量。

AI项目与工具 2025年06月11日 18 点赞 0 评论 926 浏览

视频生成技术

首页

视频生成技术

列表

默认

浏览次数

发布日期

TIP